昨天介紹了如何產生 CDF,藉由 CDF 函式我們可以找出 Key 近似的位置,那接著我們就可以建置 Model 進行初步的測試嚕 ~
Model 的種類很多種,今天先來介紹簡單且大家蠻常用的 簡單線性回歸(Simple Linear Regression)。
為了要尋找兩種資料的關係,建立一線性函式表示他們的關係。
資料 X 我們稱為 自變量,資料 Y 稱為 因變量,找出 X, Y 的線性關係,也就是找出他們的線性函式,在這裡我們稱為 F,尋找出函式的 a, b 就是 斜率 與 偏移量。
Simple Linear Regression 的自變量只有一個,如果自變量為多個 X1, X2, X3 ..Xn,則稱為 Multiple Linear Regression。
附上不錯的文章
Reference
找出資料關係的線性函式,可以使用以下兩種方法 : Least Square Method、Gradient Descent
最小平方法,快速地求得數據的線性函式,可以讓函式求得的資料與實際資料間 誤差的平方合最小。
梯度下降法,一種最佳化演算法,尋找一個函數(誤差函式)的局部最小值。
維百都有詳細的解釋兩種演算法,以下這篇文章對於Gradient Descent也有詳細的介紹,講得非常好、非常清楚餒 !! 大家可以參考看看~
Reference
今天先到這邊,明天會實作 Simple Linear Regression,並進行測試 !
先降~~~掰噗 ! !